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Berapakah peluang 8 dari 20 orang jejaka untuk diterima pinangannya? 


Rumus Distribusi Binomial : 
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Kita masukkan n—20 dan k—8 pada persamaan di atas. 
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Lalu kita buat nilai phi bervariasi dari 0 hingga 1. Hasilnya seperti ada di tabel di 
bawah ini. 


Tabel 1. Probabilitas Distribusi Binomial (n—20: k—8) 








T Probabilitas 
0.1 0.00 
0.2 0.02 
0.3 0.11 
0.4 0.18 
0.5 0.12 
0.6 0.04 
0.7 0.00 
0.8 0.00 
0.9 0.00 





Nilai maksimal berada pada nilai n sama dengan 0.4. Dengan demikian probabilitas 
yang paling menjelaskan peluang 8 dari 20 orang pria adalah 0.4. Nilai ini sama dengan 
p=k/n atau 8/20. Kenapa bisa terjadi? Karena nilai rerata populasi sama dengan rerata 
pada sampel. Kita hanya meneliti pada 20 orang itu saja tidak digeneralisasikan pada 
populasi jejaka secara keseluruhan. 


Uji Hipotesis pada Proporsi Tunggal 
Dalam menguji hipotesis rerata populasi tunggal ketika variabel bersifat kontinum, uji 
statistik dibangun dan dievaluasi berdasarkan probabilitas distribusi normal. Sebaliknya, 


yang diuji adalah proporsi populasi tunggalmaka variabel yang kita cermati berbentuk 
diskrit. 

Kasus. Misalnya perusahaan menetapkan bahwa 80% karyawan harus memiliki NPWP. 
Kita lalu mensurvei 10 karyawan. Dari 10 karyawan tersebut 7 orang (70%) telah 
memiliki NPWP. Pertanyaannya adalah apakah kepemilikian NPWP pada karyawan 
kita telah memenuhi harapan perusahaan? Hipotesis nihil (H0) yang kita uji adalah 
n=0.8 dan hipotesis alternatif (H1) kita adalah 1x0.8. 


A. Uji Hipotesis Melalui Distribusi Binomial 


Marilah kita gunakan rumus distribusi binomial dengan menetapkan nilai n—10 dan 
1—0.8, sedangkan nilai k kita buat bervariasi. 


10 
P(Y = k) = | g Josta — 0.8 
Variasi hasilnnya dapat dilihat pada Tabel 2. Dengan menggunakan nilai taraf 


signifikansi a=0.05, dapat kita lihat bahwa nilai yang berada di luar 0,05 merupakan 
wilayan ketika HO kita tolak. Kita lihat pada bagian P kumulatif untuk P(Y—7) adalah 


0,32. Karena 0,32>0,05 maka kita simpulkan tidak ada perbedaan antara data kita 
dengan harapan perusahaan. Dengan kata lain, sampel kita masih mengikuti 1—0.8. 


Tabel 2. Probabilitas Distribusi Binomial (n—10 dan 1—0.8) 








ai P(Y=k) 
k Re Kumulatif 
0 0.0000 0.0000 
1 0.0000 0.0000 
2 0.0001 0.0001 
3 0.0008 0.0009 
4 0.0055 0.0064 
5 0.0264 0.0328 
6 0.0881 0.1209 
TA 0.2013 0.3222 
8 0.3020 0.6242 
9 0.2684 0.8926 
10 0.1074 1.0000 





Jika kita menggunakan uji dua ekor 1#0.8 maka kita tinggal mengkalikan 0,32 dengan 
angka 2, hasilnya adalah 0,644. 


B. Uji Hipotesis dengan Menggunakan Normal Approximation 


Bila ukuran sampel (nilai n) relatif besar, maka distribusi binomial dapat didekati 
dengan distribusi normal. Pada kasus ini uji statistik dapat dibangun dan dievaluasi 
menggunakan distribusi normal. Pendekatan distribusi normal dipakai ketika n7 nilainya 
di atas 5 dan n(1-7) juga di atas 5. Pada kasus kita, nn sama dengan 10(0.8)»5 akan 
tetapi 10(1-0.8)5 sehingga pendekatan distribusi normal jika diaplikasikan tidak akan 
akurat. Namun demikian untuk bahan pembelajaran, prosedur ini akan tetap 
diperagakan. 


Pendekatan ini menggunakan nilai Z yang didapatkan sama seperti pendekatan dengan 
distribusi normal lainnya. 
_ Estimate - Parameter 
Standard Error 
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Distribusi binomial adalah of = nq(1— 7r) dan eror standar adalah deviasi standar 


dibagi dengan n. Oleh karena itu eror standar pada pendekatan ini di didapatkan dari 


JV1d —7)/n. Pada konteks sampel nilai ini diestimasi melalui Y/p(l—p)/n. Oleh 
karena itu persamaan yang didapat adalah: 
P= To 
pl- p)/n 
Dengan menerapkan informasi yang kita punyai maka didapatkan bahwa nilai Z yang 
dihasilkan adalah -0.69. (0.7-0.8)/V4(0.7)(0.3)/101—-0.69. Karena berada di luar nilai 
kritis penolakan HO (Z—-1.96 s/d Z—1.96) maka HO diterima. Prosedur ini dinamakan 
dengan Uji Wald. Uji ini memiliki kelemahan ketika ukuran sampel yang dipakai 


cukup kecil. Ada uji lain yang menggunakan pendekatan ini akan tetapi mengganti nilai 
eror standar yang dipakai adalah eror standar populasi. 


P — To 
nl- r)/n 


Uji ini dinamakan dengan Tes Skor. Hasil penghitungan dengan menggunakan rumus 
ini adalah (0.7-0.8)/V{(0.8)(0.2)/10}=-0.79. Konsisten hasil uji Wald, tidak 
menunjukkan hasil yang signifikan karena masih dalam rentang penerimaan HO (Z=- 
1.96 s/d Z=1.96). 


C. Uji Hipotesis dengan Rasio Kemungkinan (likelihood ratio) 


Metode ini membandingkan dua nilai kemungkinan (likelihood) yang dihasilkan dari 
probabilitas yang telah ditetapkan (Lọ) dan dari data yang diobservasi (L,). Rasio 
perbandingan (L,/L,) dinamakan dengan rasio kemungkinan (likelihood ratio). Jika L, 
lebih besar daripada Lọ maka nilai rasio yang dihasilkan lebih dari 1. Prosedur ini 
menerapkan logaritma natural pada rasio (Lọ/Lı) dan dikalikan dengan -2 untuk 
mempermudah interpretasi. Ingat, dalam kasus persamaan logaritma pembagian akan 
ditransformasi menjadi pengurangan. Hasilnya adalah sebagai berikut. 

G? — on = —2|In(L) — Inf, )| 


1 





2.00 ~ 





0.00 


2.00 ~ 


4.00 = 


In(X} 


6.00 -7 


-8.00 -7 








-10.00 ~ 





T T T T 
0.00 1.00 2.00 3.00 400 


Gambr 1. Hubungan antara z dan ln(x) 
Perhatikan Gambar 1 yang menunjukkan hubungan antara x dan In(x). Jika nilai x 
adalah 1 maka nilai In(x) sama dengan 0. Jika x adalah bilangan negatif, maka nilai 
ln(x) akan lebih kecil dari 1. Oleh karena itu jika nilai Lọ dan L, adalah sama, maka 
perbandingkan L,/L,—1, dan In(1)—0 sehingga nilai G? sama dengan 0. 
Jika L1 lebih besar dari LO maka rasio kemungkinan akan menjadi lebih kecil dari 1, 
logaritma natural akan menjadi lebih negatif, dan statistik uji akan menjadi lebih positif 
(karena dikalikan dengan -2). Oleh karena itu semakin besar dan positif nilai G? 
menunjukkan bukti yang kuat mengenai H,. 
Dengan menggunakan ukuran sampel yang sesuai maka nilai G2 mengikuti distribusi 
kai-kuadrat dengan nilai df sejumlah parameter yang ditetapkan oleh H,. Untuk kasus 
proporsi tunggal maka nilai df sama dengan 1. Uji ini hanya dapat dipakai untuk uji 
dua ekor. 
Sekarang mari kita hitung masing-masing nilai kemungkinan. Untuk menghitung LO 
gunakan data populasi/harapan 1—0.8. Hasilnya adalah 0.267 


10 7 10—7 
L= PY —K)— 7 0.8 (1 — 0.8) ~" = 0.267 
Untuk menghitung L1 gunakan data dari sampel kita yaitu 1—0.8 
10 
L = P(Y = k) = 5 ora — 0.77 = 0.201 


Setelah Lọ dan L, didapatkan maka kita menghitung G,. Hasilnya adalah sebagai 
berikut: 


0.201 
0.267 





L 
G? = an 0 
L 


1 





= 21| | — 0.567 

Nilai G? yang dihasilkan adalah 0.567 yang masih berada di bawah nilai kai-kuadrat 
tabel db—1 yang nilainya adalah 3.84. Dengan demikian dapat dikatakan bahwa H, yang 
mengatakan bahwa data hasil observasi sesuai dengan harapan manajemen, tidak dapat 
ditolak. 


D. Inteval Konfidensi untuk Proporsi Tunggal 


Jika uji hipotesis mengidentifikasi apakah proporsi di dalam sampel merepresentasikan 
proporsi populasi atau proporsi harapan, maka interval konfidensi menunjukkan 
informasi mengenai rentang nilai yang merepresentasikan proporsi populasi. Rumus 
standar interval konfidensi adalah sebagai berikut: 


s 
Za j2) 7) 

x/2 Jai 
Statistik adalah nilai estimasi terhadap populasi, nilai z (alpha/2) menunjukkan nilai 
kritis dan nilai deviasi standar (s) dibagi akar ukuran sampel (n) menunjukkan eror 
standar. Jika diterapkan pada konteks interval konfidensi proporsi maka nilai kritis 
yang dimasukkan adalah z—1.96 (untuk tingkat kepercayaan 95%). Nilai eror standar 


menggunakan nilai pada rumus uji Wald yaitu V{p(l-p)/n}. Dengan demikian rumus 
yang didapatkan adalah: 


Statistics 
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Dari kasus di atas, dapat diketahui bahwa kita memiliki p=0.7; a—0.05 sehingga 
Za 51.96: dan n=10. Dengan demikian didapatkan interval konfidensi kita adalah: 


0.7+1.96(0.145)=0.7+0.284 atau antara 0.416 hingga 0.984 


Dengan demikian kita simpulkan bahwa karyawan yang memiliki NPWP terletak pada 
proporsi antara 42% hingga 98%. Rentang ini cukup besar dikarenakan eror standar 
yang dipakai di sini berasal dari Uji Wald yang kurang reliabel ketika dipakai pada 
ukuran sampel yang kecil. 


E. Uji Ketepatan (Goodness of fit) distribusi 


Metode ini dapat dipakai untuk menguji apakah data yang kita miliki sesuai dengan 
harapan ataukah tidak. Yang dimaksud dengan harapan di sini dapat berupa distribusi 
populasi atau distribusi yang telah kita pakai sebagai acuan. Kalau uji sebelumnya 
dipakai pada data dikotomis (sukses vs gagal), maka uji ini dapat dipakai pada data 
kategorikal lebih dari dua alternatif. Hipotesis nihil (H0) yang diuji adalah antara 
distribusi teramati (yang didapatkan dari pengambilan data) sama dengan distribusi 
harapan. Oleh karena itu nilai statistik yang signifikan menunjukkan bahwa H0 kita 
tolak. 


Kasus. Sebuah perusahaan sepatu menetapkan proporsi ukuran sepatu yang perlu 
dilepas ke pasaran seperti yang terlihat pada tabel (distribusi harapan). Di tabel 
tersebut juga ditampilkan hasil survei di gudang pada 100 berdasarkan ukurannya 
(distribusi teramati). 








Proporsi Proporsi 

Ukuran Harapan Panen 
37 15% 12% 
38 40% 42% 
39 30% 26% 


40 15% 20% 


Yang menjadi pertanyaan adalah apakah koleksi sepatu di gudang telah mencerminkan 
harapan dari perusahaan? 


Jawab. Kita tentukan nilai kritis kai-kuadrat dengan db—3 (4 kategori minus 1) pada 
taraf signifikansi 5% adalah 7.82. Dengan demikian nilai kai-kuadrat di atas 7.82 
menunjukkan bahwa hipotesis nihil kita ditolak. 

Rumus yang kita pakai adalah kai-kuadrat. O adalah nilai observed alias teramati dan E 
adalah nilai expected alias harapan. 


De - (0, — E,Y 
xX za S 


i—1 i 


Kita masukkan angka di dalam tabel ke dalam persamaan. 


= 0.03 





2 _ (2—15? _ (42—40? (26 — 307 n (20 — 15) 
i 5 æ 30 

Nilai kai-kuadrat hitung yang didapatkan adalah 0.03. Karena masih di bawah kai- 

kuadrat tabel maka didapatkan kesimpulan bahwa HO tidak ditolak. Kesimpulannya 

adalah distribusi data teramati sesuai dengan harapan. Kai-kuadrat sangat sensitif 

terhadap ukuran sampel sehingga kurang tepat jika diaplikasikan pada jumlah kategori 

yang sedikit seperti pada kasus ini. 


Uji kai-kuadrat juga dapat diterapkan pada statistik rasio kemungkinan (likelihood ratio 
statistics). Rumusnya adalah sebagai berikut: 





. . c O. 
G? = 2) (frekuensi teramati) In Pelan sa = 25 O, In| — 
frekuensi harapan PET N E > 


Angka di dalam tabel kita masukkan ke dalam persamaan. 


CG? =2 





12 x In 12 + 42 x In “2 20xtn| 2) + 20x 122] = 0.03 
15 40 30 15 


Hasil analisis sama dengan kai-kuadrat sebelumnya (kebetulan sama). Sebagai catatan, 
jika frekuensi harapan dan terobservasi sama maka G2 yang dihasilkan sama dengan 0 
dan nilainya meningkat ketika perbedaan keduanya meningkat. 


II. Generalized Linear Model (GLM) 


GLM memuat tiga komponen, yaitu komponen random, komponen sistematik dan fungsi 
penghubung (link). Komponen random adalah distribusi keluaran variabel (Y), 
komponen sistematik adalah variabel prediktor, dan fungsi penghubung adalah 
cara menghubungkan X dan Y melalui transformasi tertentu sehingga keduanya 
memiliki hubungan linier. 


Komponen Random. Ketika variabel dependen (Y) bersifat kontinum maka 
diasumsikan memiliki berasal dari sumber yang acak dan terdistribusi normal. Namun 
ketika variabel tersebut berbentuk dikotomi/pilah atau kategorikal, maka distribusi data 
variabel tersebut tidak perlu diasumsikan normal. Jika datanya berbentuk dikotomi 
(sukses vs. gagal) maka diasumsikan mengikuti distribusi Binomial. Akan tetapi jika 
merupakan sebuah jumlah (misalnya kendaraan yang parkir per jam) maka diasumsikan 
mengikuti distribusi Poison. 


Komponen Sistematik. Prediktor dianggap komponen sistematis dari model karena 
mereka secara sistematis menjelaskan perbedaan dalam variabel hasil dan diperlakukan 
sebagai sesuatu yang menetap, bukan variabel yang acak. Komponen sistematis GLM 
menentukan prediktor (X) memprediksi nilai terprediksi atai nilai harapan |E(Y)] dari 
variabel keluaran secara linier. Perlu dicatat bahwa masing-masing prediktor mungkin 


merupakan kombinasi dari prediktor lain, misalnya X,—X,X, atau hubungan kuadratik, 
misalnya X,—X,”. Semua hubungan ini kemudian oleh GLM dibuat linier. 


Fungsi Penghubung. Fungsi penghubung yang banyak dipakai dalam analisis data 
kategorikal adalah fungsi logit dan probit. Fungsi logit bekerja dengan baik dengan hasil 
pada variabel keluaran (Y) yang bersifat dikotomi dan diasumsikan mengikuti distribusi 
Binomial. Fungsi link probit didasarkan pada gagasan bahwa skala kontinu mendasari 
variabel keluaran (Y) sehingga menjadi dikotomis. 


Sebagai contoh, responden ditanya dukungan mereka terhadap hukuman mati. Kurang 
logis jika menganggap bahwa yang mendasari respons responden adalah skala kontinyu 
hipotetis (hypothetical continuous scale), yang berkisar dari 0 (menentang) hingga 1 
(mendukung). Kemungkinan ada sebuah sikap tertentu yang berada di antara kedua 
respons tersebut. atau variabel dikotomi. Ada sebuah level nilai ambang (threshold) 
pada skala ini yang menjadi titik perubahan antara menentang dan mendukung. 
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Jika kita mengasumsikan distribusi respons teoritis bersifat kontinu dan normal, fungsi 
probit akan mentransformasikan variabel keluaran (atau probabilitas terprediksi) dengan 
menggunakan distribusi kumulatif normal berbalik (inverse cumulative normal 
distribution). 





of 1 
E(Y)) = gír) = exp| —-5? ds = &“ Hm 
KAM) = a= pu Oo js an 
Nilai 1“ (dengan bintang) yang dimaksudkan pada persamaan di atas adalah nilai 
phiz3.14. Fungsi penghubung logit mentransformasikan probabilitas terprediksi (r) 
menjadi nilai z dalam distribusi normal kumulatif. Berikut ini karakteristik persamaan 
ini. 


Luas Area 50% 


Aan probit(T) = &(0.500) = 0 





Luas Area 5% 


atau m0050 Probit(m) = & (0.050) = —1.645 


Luas Area 97.54 


oa probit(m) = &“0.975) = 1.96 





Berdasarkan penghubung probit maka didapatkan hubungan antara X dan Y mengikuti 
persamaan di bawah ini, yang dinamakan dengan model regresi probit. 


KEY) = D (7) = a + A(X) 


Ketika komponen random (Y) berbentuk dikotomi atau biner dan diasumsikan 
mengikuti distribusi binomial, salah satu keuntungan untuk menggunakan fungsi 


penghubung probit (sebagai alterbatif dari fungsi penghubung logit) adalah bahwa nilai- 
nilai yang diperoleh dari pencocokan model (fitting) langsung dapat diubah menjadi 
probabilitas dengan menggunakan nilai dari tabel normal standar. Dalam hal ini kita 
hanya perlu mencari nilai probabilitas terkait dengan skor z yang diperoleh dari model. 


Meskipun baik fungsi logit atau probit dapat digunakan untuk model probabilitas 
harapan pada Y yang bersifat biner, penggunaan fungsi probit direkomendasikan ketika 
variabel Y mungkin memiliki distribusi normal dan ketika probabilitas diartikan sebagai 
nilai ambang respons. Di sisi lain, sedangkan fungsi logit digunakan ketika Y murni 
dikotomis dan mengikuti distribusi binomial. Secara praktis kedua fungsi penghubung 
ini biasanya menghasilkan hasil yang sama. 


A. Estimasi Parameter 


